Cách chia nhỏ , phân tách file PDF trong C#
Hướng dẫn sử dụng C# để tách tài liệu PDF hiệu quả
Tại sao cần tách tài liệu PDF?
PDF là định dạng tài liệu điện tử phổ biến, nhưng đôi khi bạn cần chia nhỏ tệp PDF lớn thành nhiều tệp riêng biệt để dễ quản lý hơn. Ví dụ: nếu tài liệu chứa nhiều chương, bạn có thể chia từng chương thành một file PDF riêng để dễ dàng tìm kiếm và đọc. Ngoài ra, việc chia nhỏ còn giúp giảm dung lượng tệp, thuận tiện cho việc lưu trữ và chia sẻ.
Trong bài viết này, chúng tôi sẽ hướng dẫn cách sử dụng C# và Spire.PDF miễn phí cho .NET để tách tài liệu PDF nhanh chóng và dễ dàng.
Bài viết bạn có thể quan tâm : Chuyển đổi PDF sang Word bằng Python với pdfminer.six và python-docx
Cách cài đặt Spire.PDF miễn phí cho .NET
- Mở dự án trong Visual Studio.
- Truy cập Quản lý gói NuGet và tìm kiếm
FreeSpire.PDF
. - Cài đặt gói Free Spire.PDF cho .NET.
JetBrains Rider 2024 – Phần Mềm Lập Trình C# và .Net Hiệu Quả MacOs App
Lưu ý: Phiên bản miễn phí hỗ trợ tài liệu tối đa 10 trang. Nếu cần xử lý tài liệu dài hơn, hãy sử dụng phiên bản thương mại.
Hướng dẫn chia PDF thành các tài liệu PDF một trang riêng biệt
Các bước thực hiện
- Tạo biến chuỗi
inputFile
chứa đường dẫn tệp PDF cần xử lý. - Tạo biến chuỗi
outDirectory
chứa đường dẫn thư mục lưu kết quả. - Tạo đối tượng
PdfDocument
để xử lý tài liệu PDF. - Tải tệp PDF vào đối tượng tài liệu.
- Sử dụng phương thức
Split
để tách mỗi trang thành một tài liệu PDF riêng biệt.
Ví dụ minh họa
using System;
using Spire.Pdf;
namespace SplitPDFIntoIndividualPages
{
class Program
{
static void Main(string[] args)
{
// Đường dẫn tệp PDF đầu vào
String inputFile = "C:\\Users\\Administrator\\Desktop\\Document.pdf";
// Đường dẫn thư mục lưu kết quả
String outputDirectory = "C:\\Users\\Administrator\\Desktop\\Output\\";
// Tạo đối tượng PdfDocument
PdfDocument doc = new PdfDocument();
// Tải tệp PDF
doc.LoadFromFile(inputFile);
// Tách mỗi trang thành một file PDF
doc.Split(outputDirectory + "output-{0}.pdf", 1);
}
}
}
Hướng dẫn chia PDF thành các tài liệu PDF với trang đã chọn
Các bước thực hiện
- Tạo biến chuỗi
inputFile
chứa đường dẫn tệp PDF đầu vào. - Tạo biến chuỗi
outDirectory
để lưu trữ kết quả. - Tạo đối tượng
PdfDocument
và tải tệp PDF nguồn. - Tạo các đối tượng mới
PdfDocument
để lưu các trang cụ thể. - Sử dụng phương thức
InsertPage
hoặcInsertPageRange
để chọn trang cần tách. - Lưu tài liệu mới bằng phương thức
SaveToFile
.
Ví dụ minh họa
using Spire.Pdf;
using System;
namespace SplitPdfByPageRanges
{
class Program
{
static void Main(string[] args)
{
// Đường dẫn tệp PDF đầu vào
String inputFile = "C:\\Users\\Administrator\\Desktop\\Document.pdf";
// Đường dẫn thư mục lưu kết quả
String outputDirectory = "C:\\Users\\Administrator\\Desktop\\Output\\";
// Tải tệp PDF nguồn
PdfDocument sourceDoc = new PdfDocument(inputFile);
// Tạo các tài liệu con
PdfDocument newDoc_1 = new PdfDocument();
PdfDocument newDoc_2 = new PdfDocument();
// Chèn các trang đã chọn
newDoc_1.InsertPage(sourceDoc, 0); // Trang đầu tiên
newDoc_2.InsertPageRange(sourceDoc, 1, sourceDoc.Pages.Count - 1); // Các trang còn lại
// Lưu các tệp PDF
newDoc_1.SaveToFile(outputDirectory + "output-1.pdf");
newDoc_2.SaveToFile(outputDirectory + "output-2.pdf");
}
}
}
Tính năng khác của Free Spire.PDF for .NET
Ngoài việc tách tài liệu PDF, Spire.PDF còn hỗ trợ:
- Hợp nhất PDF: Gộp nhiều tệp PDF thành một tệp.
- Tạo PDF: Tạo tài liệu PDF từ đầu bằng C#/VB.NET.
- Mã hóa PDF: Bảo mật tệp PDF với mật khẩu.
- Nén PDF: Giảm dung lượng tệp PDF.
Ủng hộ chức năng chuyển pdf sang word của blog !
Kết luận
Với hướng dẫn trên, bạn có thể dễ dàng chia nhỏ tài liệu PDF bằng C# và Spire.PDF. Hy vọng bài viết này sẽ giúp bạn quản lý tài liệu hiệu quả hơn!